智能论文笔记

PhyloTransformer: A Discriminative Model for Mutation Prediction Based on a Multi-head Self-attention Mechanism

Yingying Wu , Shusheng Xu , Shing-Tung Yau , Yi Wu

分类：机器学习

2021-11-03

严重的急性呼吸综合征冠状病毒2（SARS-COV-2）导致持续的大流行感染了21900万人的10/19/21，死亡率为3.6％。自然选择可以产生有利的突变，具有改善的健身优势;然而，所识别的冠状病毒可能是冰山的尖端，并且可能会随着时间的推移出现潜在的致命变体（VOC）。理解可能导致功能或免疫逃逸的新出现VOC和预测突变的模式是迫切需要的。在这里，我们开发了Phylotransformer，一种基于变压器的辨别模型，其与多头自我关注机制接合以模拟可能导致病毒生殖优势的基因突变。为了识别每个输入序列的元件之间的复杂依赖性，Phylotransformer利用高级建模技术，包括从Performer的正交随机特征方法（Hibl +）以及来自双向编码器表示的屏蔽语言模型（MLM）的新颖快速关注变压器（伯特）。从全球倡议检索的1,765,297次遗传序列培训，从全球范围内检测到所有流感数据（GISAID）数据库。首先，我们使用广泛的基线模型比较了新型突变和新颖组合的预测准确性;我们发现，这种具有统计显着性的每个基线方法都优势了。其次，我们检查了受体结合基序（RBM）的每个核苷酸中的突变预测，我们发现我们的预测是精确和准确的。第三，我们预测了N-糖基化位点的修饰，以鉴定与在病毒进化期间可能有利的改变的糖基化相关的突变。我们预计Phylotransformer可以引导积极的疫苗设计，以有效靶向未来SARS-COV-2变体。

translated by 谷歌翻译

Multi-Reference Image Super-Resolution: A Posterior Fusion Approach

Ke Zhao , Haining Tan , Tsz Fung Yau

分类：计算机视觉

2022-12-20

Reference-based Super-resolution (RefSR) approaches have recently been proposed to overcome the ill-posed problem of image super-resolution by providing additional information from a high-resolution image. Multi-reference super-resolution extends this approach by allowing more information to be incorporated. This paper proposes a 2-step-weighting posterior fusion approach to combine the outputs of RefSR models with multiple references. Extensive experiments on the CUFED5 dataset demonstrate that the proposed methods can be applied to various state-of-the-art RefSR models to get a consistent improvement in image quality.

translated by 谷歌翻译

Traversability analysis with vision and terrain probing for safe legged robot navigation

Garen Haddeler , Meng Yee , Chuah , Yangwei You , Jianle Chan , Albertus H. Adiwahono , Wei Yun Yau , Chee-Meng Chew

分类：机器人

2022-09-01

这项研究受到人类行为的启发，提议使用探测策略，并将其整合到遍布性分析框架中，以解决未知的粗糙地形上的安全导航。我们的框架将可折叠信息整合到我们现有的遍历性分析中，因为仅视力和几何信息可能会被不可预测的非刚性地形（例如柔软的土壤，灌木丛或水坑）误导。通过新的遍历性分析框架，我们的机器人对不可预测的地形进行了更全面的评估，这对于其在室外环境中的安全至关重要。该管道首先使用RGB-D摄像头确定地形的几何和语义性能，并在可疑地形上探测位置。使用力传感器对这些区域进行探测，以确定机器人在其上面时崩溃的风险。该风险被称为可折叠度度量，该指标估计了不可预测的区域的地面可折叠性。此后，将可折叠性度量以及几何和语义空间数据结合在一起，并分析以产生全局和局部穿术网格图。这些遍历性网格地图告诉机器人是否可以安全地跨越地图的不同区域。然后使用网格图来生成机器人的最佳路径，以安全地导航其目标。在模拟和现实世界实验中，我们的方法已在四足动物的机器人上成功验证。

translated by 谷歌翻译

Towards Reproducible Evaluations for Flying Drone Controllers in Virtual Environments

Zheng Li , Yiming Huang , Yui-Pan Yau , Pan Hui , Lik-Hang Lee

分类：机器人

2022-07-29

对无人机航班自然用户界面（NUI）的研究注意力正在上升。然而，NUI是高度多样化的，主要通过不同的物理环境进行评估，从而导致这种解决方案之间难以兼容的性能。我们提出了一个虚拟环境，即Vrflightsim，从而实现了具有丰富无人机飞行详细信息的比较评估，以解决此问题。我们首先复制了最新的（SOTA）接口，并在虚拟环境中设计了两个任务（交叉和指向）。然后，两名与13名参与者的用户研究证明了VRFlightSIM的必要性，并进一步强调了开放数据界面设计的潜力。

translated by 谷歌翻译

Applied Federated Learning: Architectural Design for Robust and Efficient Learning in Privacy Aware Settings

Branislav Stojkovic , Jonathan Woodbridge , Zhihan Fang , Jerry Cai , Andrey Petrov , Sathya Iyer , Daoyu Huang , Patrick Yau , Arvind Sastha Kumar , Hitesh Jawa

分类：机器学习

2022-06-02

经典的机器学习范式需要在中心位置汇总用户数据，在该位置，机器学习实践者可以预处理数据，计算功能，调整模型并评估性能。这种方法的优点包括利用高性能硬件（例如GPU）以及机器学习实践者在深度数据分析中进行的能力以提高模型性能。但是，这些优势可能是为了支付数据隐私的费用。收集，汇总并存储在集中式服务器上以进行模型开发。数据集中构成风险，包括内部和外部安全事件的风险增加以及意外数据滥用。具有不同隐私的联合学习旨在通过将ML学习步骤带给用户的设备来避免服务器端集中化陷阱。学习是以联合方式完成的，每个移动设备都在模型的本地副本上运行一个训练循环。来自设备模型的更新通过加密通信和通过差异隐私发送到服务器，以改善全局模型。在此范式中，用户的个人数据仍在其设备上。令人惊讶的是，以这种方式培训模型培训的模型性能差异很小。但是，由于其分布式性质，异质计算环境和缺乏数据可见性，联邦学习带来了许多其他挑战。本文探讨了这些挑战，并概述了我们正在探索和测试的建筑设计解决方案，以在元评估中生产联合学习。

translated by 谷歌翻译

Approximating Nash Equilibrium in Random Graphical Games

Morris Yau

分类：机器学习

2021-12-07

计算纳什均衡在多智能体游戏中是博弈论和计算机科学界面的长期挑战。众所周知，N个玩家和K策略中的一般正常形式游戏需要指数空间只是简单地写下。这种多代理的这种诅咒促使简洁游戏的研究可以有效地写下来。简洁游戏的规范示例是图形游戏，该图形游戏将播放器塑造为图形中的节点，只与他们的邻居与马尔可夫随机字段直接类似的邻居进行交互。图形游戏在无线，金融和社交网络中找到了应用程序。然而，计算图形游戏的纳什平衡已经证明了具有挑战性。即使对于PolyATRIX游戏，也可以将对代理人的资助的模型作为与代理邻居的交互的交互之和，所以证明计算epsilon近似NASH平衡是epsilon的PPAD，用于epsilon小于常数。这项工作的重点是通过考虑平均水平图模型i.e随机图来避免这种计算硬度。我们提供了一种用于计算PolyAtrix游戏的ePsilon近似NASH平衡的QuaSiewolynomial时间近似方案（QPTA），其具有高于Poly（k，1 / epsilon，ln（n））$的随机图。此外，通过相同的运行时间，我们可以计算epsilon - 近似的纳什均衡，即epsilon - 近似于游戏任何纳什均衡的最大社会福利。我们的主要技术创新是一种用于纳什均衡问题的新型等级凸面计划的“加速舍入”。我们加速的舍入也为MAX-2CSP的同一类随机图中的MAX-2CSP提供了更快的算法，这可能具有独立兴趣。

translated by 谷歌翻译

Kalman Filtering with Adversarial Corruptions

Sitan Chen , Frederic Koehler , Ankur Moitra , Morris Yau

分类： (统计)机器学习 | 机器学习

2021-11-11

在这里，我们重新审视线性二次估计的经典问题，即估计线性动力系统从嘈杂测量的轨迹。当测量噪声是高斯时，庆祝的卡尔曼滤波器提供了最佳估计器，但是当一个人偏离这种假设时，广泛众所周知，众所周知会破裂。当噪音重尾时。许多临时启发式机启发式就是处理异常值的实践中。在开创性的工作中，Schick和Mitter在测量噪声是高斯的已知无穷无尽的扰动时给予了可证明的保证，并提出了一个可以获得类似的禁令的重要担保的重要问题。在这项工作中，我们给出了一个真正强大的过滤器：当甚至恒定的测量分数都存在对比腐败时，我们给出了线性二次估计的第一个强化保证。该框架可以模拟重型且甚至是非静止噪声过程。我们的算法在与知道损坏位置的最佳算法竞争的意义上强调了卡尔曼过滤器。我们的作品处于挑战性的贝叶斯环境，其中测量数量与我们需要估计的复杂性缩放。此外，在线性动态系统中过去信息随时间衰减。我们开发了一套新技术，以强大地提取不同时间步长和不同时间尺度的信息。

translated by 谷歌翻译

A Study of Face Obfuscation in ImageNet

Kaiyu Yang , Jacqueline Yau , Li Fei-Fei , Jia Deng , Olga Russakovsky

分类：计算机视觉

2021-03-10

脸部混淆（模糊，镶嵌等）已被证明对隐私保护有效；然而，对象识别研究通常假设访问完整的，无刺激的图像。在本文中，我们探讨了面部混淆对流行的Imagenet挑战视觉识别基准的影响。 ImageNet挑战中的大多数类别不是人类类别。但是，许多偶然的人出现在图像中，他们的隐私是一个问题。我们首先注释数据集中的面孔。然后，我们证明面部混淆对识别模型的准确性的影响最小。具体而言，我们在混淆图像上基准了多个深层神经网络，并观察到总体识别精度仅略有下降（<= 1.0％）。此外，我们尝试将学习转移到4个下游任务（对象识别，场景识别，面部属性分类和对象检测），并表明在混淆图像上学习的功能同样可以传递。我们的工作证明了隐私感知视觉识别的可行性，改善了高度使用的Imagenet挑战基准，并为将来的视觉数据集提出了重要的途径。数据和代码可从https://github.com/princetonvisualai/imagenet-face-obfuscation获得。

translated by 谷歌翻译